Snowflake Marketplace上でインテージ社が提供する商品マスタと店舗マスタのサンプルを試してみた #SnowflakeDB
※本エントリは、Snowflakeをもっと使いこなそう! Advent Calendar 2022の3日目の記事となります。
さがらです。
Snowflake Marketplace上でインテージ社が提供する商品マスタと店舗マスタのデータのサンプルを試してみたので、その内容をまとめてみます。
Snowflake Marketplaceとは
Snowflake Marketplaceは、サードパーティのデータに簡単にアクセスすることが出来るSnowflake上の1機能です。
Snowflakeアカウントを持つユーザーであれば誰でも利用すること出来、世界中で公開されているデータの一覧を見て、すぐに利用申請を出すことが出来ます。(データは、すぐに無料で使うことが出来るものもあれば、一度データの管理元から承認を得た上で定期的に利用費用を払わないと使えないものもあります。)
日本市場でも徐々にSnowflake Marketplaceでデータを公開する企業が増えており、2022年10月24日には東芝テック社、インテージ社、Tangerine社、xMAP社、エム・データ社、メディカル・データ・ビジョン社、QUICK社、の7社がSnowflake Marketplaceでデータを公開することを発表しています。詳細は下記の記事をご覧ください。
この7社がSnowflake Marketplaceで公開しているデータのうち、サンプルデータが無料で公開されている内の1つを本記事にて試してみます。
インテージ社の提供するデータについて
インテージ社ですが、国内最大手のマーケティングリサーチ企業であり、消費者パネル、全国小売店パネル、Geometrics、など多様なデータも保有しております。
そのインテージ社が、Snowflake Marketplace上でJapanese Product Master (Sample) 商品マスターとJapanese Store Data Master (Sample) 店舗マスターとして、インテージ社が保有する商品や店舗のデータを公開しております。
以下は、Snowflake Marketplaceで公開している情報の引用です。
業界最大級の商品情報データベースを有しています。商品マスター専門部隊が商品情報を日々メンテナンスしており、その実績は20年を超えます。
「全国5万人以上の消費者購買履歴データ」、「全国6,000店舗の小売店販売データ」より食品・飲料・アルコール・雑貨・化粧品・OTC医薬品など幅広い業界の実際に「売れているもの」、「買われているもの」の情報を収集、さらに「各種業界の商品マスター」等の商品情報も合わせた毎月約20,000件以上の商品データの中から、市場・業界動向等、お客様のご要望に応える形で選別し、GTIN毎に「商品名」「商品分類」「容量」等の項目を整備しながら、毎月10,000件以上の商品情報データを登録しています。
豊富な分類項目により、多角的なデータ分析にご活用いただけます。
分類、整理された情報を取り入れることで御社の商品マスターを更に使いやすく整備することが可能になります。 売り場の提案、企画作りにもご活用いただけます。
インテージが独自に収集整備した、主に消耗消費財を販売している、全国小売チェーンの位置情報付き店舗データベースになります。
量販店を中心に、以下業態の店舗の情報をまとめています。
・食品スーパーマーケット(SM)、コンビニエンスストア(CVS)、ホームセンター・ディスカウンター(HC/DS)、ベビー専門店、ドラッグストア(DRUG)、酒類ディスカウンター(酒DS)
また、インテージ独自の基準・定義による店舗属性を複数準備し、店舗分析を始め様々な用途・目的にご活用いただけるデータベースとなっています。
試してみた
ということで、実際にSnowflake Maketplaceからデータを取得し、どんなデータが入っているのかを確かめてみます!
サンプルデータの取得
※手順がほぼ同じのため、ここではJapanese Product Master (Sample) 商品マスター
だけ、取得方法を記載します。
まず、使用するロールをIMPORT SHARE
権限を持っているロールに変更してください。(デフォルトではACCOUNTADMIN
のみ保持しています)
Snowflake上でMarketplace
を押します。
続いて、一番上の検索BOXにintage
と入れて検索します。すると、Japanese Product Master (Sample) 商品マスター
が出てきますのでクリックします。
このページでは、データの説明やサンプルクエリを見ることが出来ます。
データを利用するためには、画面右の取得
を押します。
すると、下図のようなポップアップが表示されます。オプションを開くと、アカウント上に作成するデータベース名を変更したり、現在使用しているロール以外にどのロールにこのデータへのアクセスを出来るようにするか設定が可能です。
これらの設定が終わったら、取得
を押します。
この後、対象のデータベースができていれば準備は完了です!
サンプルデータへのクエリ:商品マスタ
Marketplace上に載っていたサンプルクエリを中心に、商品マスタのデータに対してクエリをしてみます。
まず1つ目は、「機能性表示食品」に該当する商品を、全項目出力するクエリです。
Select * from ITEM Where "機能性表示食品" Like '機能性表示食品';
商品名、メーカー名、飲料や菓子類などの分類、梱包されている容器、といった商品に関する様々な属性情報が登録されていることがわかります。 ※注意点:商品名称
はサンプルデータにおいてはマスキングされています。
2つ目は、インテージ社が独自に定義した市場規模の大きさを5段階で示すカルテ・売れ筋
列において、超主力商品
に絞り込んで全項目出力するクエリです。(超主力商品
は、5段階のうち最も市場規模が大きい判定を受けた商品のレコードに付けられるようです。)
Select * from ITEM Where "カルテ・売れ筋" Like '超主力商品';
サンプルデータへのクエリ:店舗マスタ
Marketplace上に載っていたサンプルクエリを中心に、店舗マスタのデータに対してクエリをしてみます。
まず1つ目は、新潟市の店舗について業態別、売場面積別に降順に並べて、テーブルの全項目を出力するクエリです。
SELECT * FROM STORE WHERE "市区町村名" Like '新潟市%' ORDER BY "業態コード", "売場面積" DESC;
データの内容を見ると、店舗名、チェーン名、詳細な住所と緯度経度、売り場面積、駐車場台数、営業時間、周辺居住者特性、駅からの距離、など、店舗に関する多様なデータがあることがわかります。
2つ目は、市区町村・業態別に、売り場面積のランクごとにどれだけの店舗数があるのかを集計するクエリです。
SELECT "市区町村コード", "都道府県名", "市区町村名", "業態名", "売場面積rank", Count ("店舗コード") AS "店舗コードのカウント" FROM STORE GROUP by "市区町村コード", "都道府県名", "市区町村名", "業態名", "売場面積rank" Order by "売場面積rank" ASC, "店舗コードのカウント" DESC;
ざっと眺めただけでも、都内など都市部では大規模な店舗が少なく、逆に小規模な店舗が多いことがわかります。
3つ目は、市区町村・業態別に、店舗運営企業単位の各都道府県への展開数をもとに企業タイプをカテゴライズし、店舗数を集計するクエリです。
(観測範囲では、1_ナショナル
、2_広域1
、3_広域2
、4_ブロック
、5_地元
、といったカテゴライズがされていました。)
SELECT "市区町村コード", "都道府県名", "市区町村名", "業態名", "zk企業タイプ", Count ("店舗コード") AS "店舗コードのカウント" FROM STORE GROUP by "市区町村コード", "都道府県名", "市区町村名", "業態名", "zk企業タイプ" Order by "zk企業タイプ" ASC, "店舗コードのカウント" DESC;
各カテゴライズの定義は確認する必要がありますが、すでにまとまったデータで有識者によってカテゴライズされたものを使えるのはとても便利だと思います!
最後に
Snowflake Marketplace上でインテージ社が提供する商品マスタと店舗マスタのサンプルを試してみました。
商品マスタは、他社ではどのような商品をリリースしていて、どの商品が売れ筋であるかを知る参考にできますし、店舗マスタは今後の店舗展開計画を考える上で同市内にどれだけの規模の店舗がどれだけあるかを把握することにも繋がると感じました。
気になる方はぜひSnowflake Marketplaceから申請頂き、触ってみてください!